iT邦幫忙

2025 iThome 鐵人賽

DAY 5
0

作為一個面向非工程師的系列內容,在撰寫這種工具文章的時候,目標就是希望能把每一個或大或小的功能給講清楚,讓大家能知道「有什麼功能」、「這功能有什麼用」、「什麼時候用&如何用這功能」

今天一樣來講一個看起來很小,但實際上也有很多眉眉角角的一個功能——網路資訊檢索

什麼樣的內容會需要網路資訊檢索?

不知道大家是否有用過 2022 年的 ChatGPT ?那個時候的 AI 都還沒有包含網路搜尋相關的功能,因此只要去問一些超過模型訓練資料時間點的資訊的時候,都只能得到 AI 在亂掰的回答。

語言模型的訓練資料具有時間截止點,沒辦法得知訓練完成後發生的事件或資訊。
因此,當使用者詢問任何最新消息、即時數據或需要驗證當前事實時,AI 必須透過外部網路工具來擷取最新資訊,才能確保回應的時效性和準確性,不然就會變成沒有依據的亂掰。

AI 是如何取得網路內容的?

如下面的示意圖所示,基本上就是一個這樣的流程

  1. 使用者丟出問題:使用者提出需要即時或最新資訊的問題,例如「今天台北股市的收盤指數是多少?」或「2025年諾貝爾物理學獎得主是誰?」
  2. AI 判斷要搜尋的關鍵字:AI 分析問題內容,提取關鍵資訊並構建有效的搜尋詞彙,例如將問題轉換為「台北股市 收盤 今日」或「Nobel Prize Physics 2025 winner」等搜尋關鍵字。
  3. 檢索工具搜尋:檢索工具接收 AI 提供的關鍵字,透過搜尋引擎在網路上尋找相關資訊,或直接擷取指定網址的網頁內容。
  4. 搜尋結果:網路內容以結構化的格式回傳,包含多個相關網頁的摘要、標題、來源網址和發布時間等資訊。
  5. AI 整理搜尋結果:AI 分析並篩選搜尋結果中的關鍵資訊,評估資料來源的可信度,去除重複或不相關的內容,並整合多個來源的資訊。
  6. 給出回答:AI 根據整理後的資訊生成完整的回應,引用資料來源,並以符合使用者需求的格式呈現答案,確保資訊的準確性和時效性。

https://ithelp.ithome.com.tw/upload/images/20250919/20140721Gem15S6cHA.png

Claude 是如何做網路資訊檢索的?

上面看到的是一般的 AI 是如何透過外部的網路能力,來回答使用者提出的問題的。那 Claude 除了做到這個流程以外,還有哪些值得我們來講一講的地方呢?

在搜尋前先判斷資訊類型

Claude 不會每個問題都去搜尋網路,而是會先評估問題的性質,根據不同的問題類型有不同的策略

  • 穩定知識(Stable Knowledge)👉 不需搜尋
    • 基礎科學原理、歷史事件、數學概念等不會改變的知識
    • 例如「光合作用的原理」、「二次大戰的起因」
    • 策略:直接從訓練資料中回答,節省時間並確保準確性
  • 時效性資訊(Time-sensitive Information)👉 立即搜尋
    • 股價、天氣、最新新聞、近期事件等快速變化的資訊
    • 例如「今天的美元匯率」、「本週的颱風動態」
    • 策略:立即執行網路搜尋,確保提供最新資訊
  • 複雜研究任務(Complex Research)👉 多次搜尋
    • 需要比較多個來源或深入分析的綜合性問題
    • 例如「分析各大雲端服務商的 AI 功能比較」
    • 策略:執行多輪搜尋,從不同角度收集並整合資訊

根據需求使用不同的工具

Claude 有兩種主要的網路資訊擷取工具,會根據任務需求選擇使用:

  • web_search(網路搜尋):像使用 Google 搜尋一樣,輸入關鍵字後獲得多個網頁的摘要。適合探索性查詢、需要比較多個資訊來源,或是不確定哪個網站有答案的情況。
  • web_fetch(網頁擷取):直接讀取特定網址的完整內容,類似開啟網頁詳細閱讀。當你提供具體網址,或 Claude 在搜尋結果中發現重要文章需要深入了解時,就會使用這個工具。

這兩個工具經常協同運作:先用 web_search 找到相關資源,再用 web_fetch 深入閱讀最重要的幾篇。

Claude 如何處理和引用網路資源

畢竟網路上其實並不是所有的內容都可信,很多時候需要去旁判斷它的來源

而 Claude 在使用網路資源時有這樣一套處理原則:

  • 資訊整合而非複製
    • 不會直接複製貼上網路內容
    • 理解、分析後用自己的方式重新表達 👉 確保不侵犯版權
    • 引用原文時會限制在極短句子內,並明確標註來源
  • 來源標註與可信度評估
    • 回答中會標明資訊來源連結
    • 優先採用官方網站、學術機構、知名媒體等可信來源
    • 不同來源資訊衝突時 👉 明確指出差異供使用者判斷
  • 結構化呈現資訊
    • 將零散的網路資訊整理成有條理的回答
    • 去除重複內容,保留關鍵資訊
    • 以易讀格式呈現 👉 讓使用者快速掌握重點

Claude 搜尋的限制

寫在最後值得注意的是,並不是所有的網路內容都能讓 Claude 取得的。以下這些內容都是 Claude 無法存取的:

  • 需登入的內容:付費新聞網站、私人社群媒體、企業內部網站等需要帳號密碼的內容。
  • 動態載入網頁:如果頁面內容使用 JavaScript 動態渲染的話,Claude 也無法直接讀取。
  • 即時性落差:搜尋引擎索引需要時間,剛發生幾分鐘的事件可能還未被收錄。
  • 地區限制內容:某些地區限定或有地理位置限制的網站內容可能無法完整取得。

上一篇
【Day04】Claude 提示詞技巧與範例
下一篇
【Day06】Claude 系統提示詞(system prompt)
系列文
從 Claude 到 Claude Code,非工程師小白也能掌握的辦公效率神器7
圖片
  熱門推薦
圖片
{{ item.channelVendor }} | {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言